Il misterioso Easter Egg dell'intelligenza artificiale al centro di "Eddington" di Ari Aster

Il nuovo film del prodigio dell'horror Ari Aster, Eddington, ha diviso il pubblico e ha scatenato un acceso dibattito online su cosa esattamente il regista stia cercando di dire sul nostro rapporto collettivo con la tecnologia (suggerimento: probabilmente non è un buon messaggio). La storia è incentrata su una piccola città del Texas che sprofonda nel caos causato dai social media durante la pandemia di Covid-19. Il film vede Joaquin Phoenix nei panni dello sceriffo locale Joe Cross, che si scontra con il sindaco della città, interpretato da Pedro Pascal, mentre il resto della comunità perde la testa per varie controversie politiche e culturali.
La trama del film è complessa e ricca di sottotrame, ma uno dei filoni narrativi più intriganti riguarda la controversa installazione di un nuovo data center vicino ai confini della città. L'azienda dietro la nuova, inquietante struttura ha un nome molto particolare: SolidGoldMagikarp. A quanto pare, questo nome sembra essere un riferimento a un concetto relativamente oscuro nello sviluppo dell'intelligenza artificiale noto come "glitch token".
Nel mondo dell'addestramento dell'IA, il processo di "tokenizzazione" consiste nel tradurre il testo umano in dati numerici interpretabili dall'LLM. Per fare questo, i ricercatori inseriscono enormi quantità di testo umano in programmi software chiamati "tokenizzatori". I tokenizzatori traducono i dati grezzi, da qualcosa che gli esseri umani possono comprendere, in dati analizzati, progettati per l'uso da parte delle macchine, denominati "token". I token vengono poi inseriti in un modello linguistico durante la fase di "addestramento". Il processo di addestramento consiste nell'insegnare a un algoritmo a interagire con un essere umano: è così che chatbot come ChatGPT imparano a rispondere ai comandi di un essere umano e a produrre un output, o risposta.
La tokenizzazione può avere un vantaggio fiscale per le aziende, poiché può rendere più efficiente e meno costoso l'elaborazione di grandi quantità di dati; un tokenizzatore potrebbe essere giustamente paragonato a un compilatore software che traduce l'input umano in codice binario comprensibile per un computer.
I modelli linguistici di grandi dimensioni sono semplicemente algoritmi predittivi progettati per costruire il linguaggio sulla base di input umani. Come la correzione automatica, ChatGPT è progettato per apprendere sequenze di parole e riprodurle. "Questo è letteralmente tutto ciò che fanno", ha detto a Gizmodo Jessica Rumbelow, CEO dell'azienda di intelligenza artificiale Leap Labs. "Quindi, inserisci 1, 2, 3, 4 e il modello viene addestrato a predire 5", ha offerto, come esempio.
I token, inseriti nei LLM durante il processo di addestramento dell'IA, sono una parte fondamentale dell'insegnamento a un programma di come comunicare con gli esseri umani. Esiste tuttavia un'eccezione fondamentale a questa regola, ovvero il fenomeno noto come "glitch token". Rumbelow ha affermato che il sistema dei token "in genere funziona molto bene, tranne quando si hanno token che il modello non ha mai visto" prima. Quando un LLM incontra un token su cui non è stato addestrato, può produrre un comportamento molto anomalo nel programma.
SolidGoldMagikarp è uno di questi "glitch token" che, in passato, ha introdotto comportamenti bizzarri negli LLM. Rumbelow ne sarebbe a conoscenza. Lei e il suo partner di ricerca, Matthew Watkins, hanno scoperto questo particolare glitch token mentre stavano studiando il fenomeno dei token anomali. Rumbelow afferma che quando il token è stato inserito nell'LLM, ha prodotto risultati bizzarri. Il programma potrebbe balbettare cose senza senso, pronunciare frasi e sentimenti indiretti e minacciosi, o comunque mostrare un comportamento aggressivo e ostile nei confronti dell'utente.
"Pensiamo che sia ciò che accade quando il modello non ha visto quel token durante il suo processo di addestramento", ha detto Rumbelow. L'IA "non sa cosa fare con l'input" perché non l'ha mai visto prima, ha aggiunto.
Attenzione: spoiler!In breve, espressioni come SolidGoldMagikarp sono espressioni oscure che possono far impazzire temporaneamente un modello di intelligenza artificiale. In che modo SolidGoldMagikarp si collega ai temi del nuovo film di Aster? Nessuno può saperlo, ma si potrebbero facilmente azzardare diverse interpretazioni.
Vale la pena notare che, nonostante la loro varietà, i film di Aster hanno tutti più o meno lo stesso finale. Ogni film si conclude con le forze dell'oscurità che trionfano sul protagonista della storia. In ogni caso, il personaggio diventa parte dei piani cospirativi delle forze oscure. In Hereditary , la famiglia Graham diventa pedine indifese nella cerimonia demoniaca di una congrega. In Midsommar , la rabbia repressa di Dani viene usata come arma contro il suo fidanzato dagli Hårga. In Beau is Afraid , il personaggio principale non riesce a sfuggire alla soffocante rete di sua madre, e la sua intera vita diventa poco più che la base per un rituale di umiliazione kafkiano.
In Eddington, un film sul nostro rapporto travagliato con la tecnologia, la forza oscura trionfante è Internet stessa, e gli abitanti della città, in particolare Joe, sono intrappolati nelle sue macchinazioni basate sui dati. Il data center, la manifestazione fisica del dominio di Internet sulle nostre vite, è il vero vincitore del film, e tutti i personaggi umani ne diventano emissari, pedine o vittime. La decisione di Aster di dare al data center il nome di una parola canaglia che, attraverso una sorta di incantesimo digitale, può mandare in tilt un sistema altrimenti sano potrebbe essere il suo modo di fare riferimento a ciò che la tecnologia sembra aver fatto a tutti noi prendendo il controllo delle nostre vite, ed è probabilmente un avvertimento di ciò che deve ancora accadere.
gizmodo